사전에 캠페인이 제안되었다. 이 사례의 목표는 대출제안을 수락할 것 같은 고객의 특징을 찾는 데 있다.
분류나무 모형
전체 변수를 사용했을 때 가장 낮은 RMSE값 도출
규칙 1
IF(소득>118.5)
AND(월별 신용카드 사용액>2.95)
AND(담보부채권>41)
규칙 2
IF(소득>118.5)
AND(교육 수준>1.5)
로지스틱 회귀분석모형을 이용하여 추정하였다. 연구결과는 다음과 같이 요약된다.
≪ … 중 략 … ≫
Ⅱ. 중소기업의 기술혁신 모형
기술혁신과정을 분석하기 위한 여러 가지 시스템 접근방법 중 본 연구에 적합한 모델로 Carlsson and Stankiewicz(1991)의 기술시스템(technological systems: TSs)을
로지스틱 회귀모형을 통해 독립변수와 종속변수와의 관계를 분석하였다.
1) 각각의 독립변수들은 독립인가
로지스틱 회귀분석을 하기 전에, 독립변수들간의 독립이 아니어서 교호작용이 있을 경우, SAS를 통한 가설 검정 및 결과분석 방법이 달라지게 된다. 따라서 우선 독립변수들 사이의 독립성
1. 변수분할
- 7:3으로 1000개의 변수 분할 (7==Training Group, 3==Test Group)
2. 변수정리 / 기초작업(scoring, exclusion, dummy, metric 규정)
1) Checking account(부도율과 음의 상관관계) : 계정이 없다부터, 계정이 커질수록 높은
점수를 배치하였다. 하지만 각 분포별 부도율을 보면, checking account가 없는 집단의
18세기중엽부터 시작된 산업혁명은 지난 200년간 인류문명을 지배하였다. 산업사회에서 인류가 물질적인 풍요를 누릴 수 있었던 것은 인류의 육체적인 노동이 기계로 대체되면서 대량 생산과 소비가 가능할 수 있었기 때문이다. 산업사회의 이미지를 대표하는 것은 기계, 전기 등과 같은 것이었고 이것
모형 접근방법과 비교하여 약술하시오. (5점) 2. 빅데이터 시대의 도래로 우리 사회는 많은 변화를 겪고 있다. 이러한 환경 변화로부터 비롯될 수 있는 긍정적인 영향과 부정적인 영향에 대한 자신의 견해를 기술하시오. (5점) 또한, 이와 관련한 데이터과학자의 역할을 논하시오. (3점) 3. 기업이나 기관의
도입된 이유는 관측치마다 변수가 급격히 증가하고 통제되지 않은 인간행동에 의해 생산된 데이터라는 복잡성 때문에 기존의 모수적 모형 접근방법(parametric model approach)으로는 좋은 결과를 기대하기 어려웠기 때문이다.
❷ 모수적 모형접근 방법과 알고리즘 접근방법을 비교하면 [표 1-01]과 같다.
변수 설명
☺ 종속변수 기대수명 - 출생 시 기대수명(년)
☺ 독립변수 GDP(GDP) – 1인당 GDP(US$)
산림면적비율 – 전체 땅에 대한 산림면적비율(%)
개인 의료비지출 - 건강관련 비용 지출의 1인당 평균액(US$)
공적 의료비지원 - 국가에서 지원하는 의료관